作者 | 刘哲 北京市检察院公诉部首批入额检察官
来源 | 刘哲说法
但是现在有两种观念,一种是望而却步,另一种是不以为然。望而却步者认为这是一种高科技,是检察信息化的高级阶段,一定要建立很多系统吧,太复杂、太麻烦,成本高,玩不了。另一种不以为然认为这是一种花把式,故弄玄虚,徒有其名,认为对办案帮助不大,至少是对日常办案没有太多实质的影响。这两种都对大数据都有一定程度的误解,但这种误解有一定程度的道理,而且带有一定程度的普遍性。望而却步的,认为大数据就要花大钱建系统的,都是被信息化这几年弄的有点思维定式,就是认为一定要建一个系统来,才能鼓捣这些大数据,不建就弄不了大数据,将大数据和信息化系统划等号了。其实这是不对的,因为大数据其实是一种应用,只要有了一定量的数据,就可以用一些通用的数据分析工具,就可以进行分析。有些分析工具就是像excel表这样的分析工具,本质上就是一些数据库。当然了还有一些更高级的分析工具,但这些都没有什么太大的投入,因为这些分析工具软件都是通用版本,即使购买也非常低廉。原来的所谓系统,往往是定制的,是专门为你量身定做的,而且很有可能是只有你有需求,而其他单位没有需求。这样一来成本就很高,因为软件公司不能重复销售,这样成本就会非常高。而如果系统是通用的,就比如复杂如操作系统,只要它的销售量足够大,它的成本也会变得极低,从而让普通用户都能够使用。而一些简单的数据分析,其实这些日常的分析工具就已经够用,只有超大型数据量的时候,才需要使用复杂一些的数据库工具。因此,大数据在办案中的应用不用专门为每一次大数据分析专门建设数据分析系统,因此根本不存在多高的资金投入的问题。大数据真正需要的是有想象力的头脑,需要将办案与相关数据紧密的联系起来,能够从一个点看到一个隐藏的面,通过这个隐藏的面和其他能够获得的数据进行交叉比对分析,从而在这个隐藏之面上分析出众多值得监督的线索。这是一个从个案发现类案,从类案再回到多个个案的过程,而其中的要害就是大数据的比对分析。而大数据比对分析的关键,又在于找到最有价值的数据源,找到一两个这样的源头,并通过沟通能够获得数据,剩下的就是挖掘的问题。借助这些分析工具,最重要的是设置一个数据挖掘的模型,建立一套方法,就可以自动从众多的数据项目中对比出真正需要的结果来。而这种对比分析获得结果的过程,就是大数据应用。而这种应用并不费钱,费的是智力和想象力。所以大数据应用的真正瓶颈是具有大数据思维的检察复合型人才。这些人才必须又精通案件,能够查微析疑,敏感的抓住案件的关键点,而且有发现案件隐藏疑点的能力,又要有大数据应用的意识,能够知道从哪可以获取必须的数据,这些数据的分析可能会得出什么样的结论。比如是在两个方面都高度精通才有可能通道大数据分析的障碍。因此检察大数据应用,不在于投入多少资金,而在于储备和培养了多少大数据应用人才,以及给这些人才多少的激励,可以让其将如此难得智慧拿出来。因为案件正常办也能办,也能够晋升进步,那就没有必要这么麻烦了。而既然要这么麻烦,那就一定是要些说法的,是能够得到激励的,而且一定是有榜样引领的,才会有其他检察官投入心思办这个事。所以,大数据想做成要投入什么?要投入的不是资金,而是对人才真正重用,是投入实实在在的职业上升机会。因为大数据也好,以前的一些智能化办案系统也好,不少确实是华而不实,什么机器人了,能够代替检察官自动写文书写报告的超级智能系统了,很多都是唬人的,不是替代人,反而是把人搞的更累了。既然更累,那自然还不如回到从前,没有超级智能系统的时代,有个电脑打打字就挺好,不要搞怎么多系统,成天要填各种案卡,然后很多数据还要手工统计,一定也不智能,甚至也不够系统。他们的不以为然,他们是对司法智能化的某种失望。这种失望很值得理解,因此这些系统确实没有带来其所宣称的福祉,反而是消耗和折磨。现在到了大数据,这些失望的人仍然燃不起希望,因为他们的信心被消耗没了。他们觉得还不是一个样子,说的都挺好,最后还是不行。而且大数据这个事也不是每次都靠谱啊,你原来以为可以这个数据,那个数据对比一下,就很快得出某一个结论,后来才发现还差的远着呢,而现在要其他数据,哪那么容易呢?大数据还有一个特别大的困难就要数据,因为很多数据并不为司法机关掌握,而调取数据,有时候也没有足够的法律依据,所以只能靠沟通。有时候就是求数据,像是在乞要。所以数据来源很不稳定,也不顺畅。这样一来,有些即使设计很好的数据模型,因为数据拿不来,也还是用不了。而有些数据模型也算错的时候,把现实估计的比较简单的时候,这样一来既是一开始即使好不容易拿了一些数据回来,还是有可能扑空。这就像科学实验一样,可能要一遍一遍试错。但问题是领导有没有耐心这样试错,一遍一遍再去乞要数据。一定会在乞要不顺的情况下,抱怨大数据不靠谱,并无法做到心想事成。但是大数据绝对不是没用,大数据精妙的模型,需要对案件和数据的双重理解,需要对其间变量的准确预测,而这肯定不是一蹴而就的,成功并不是那么容易。想要应用大数据者,一定要记得,你一定会要经受无数次的失败,才会慢慢接近成功。大数据思维本质是对数据时代信息分布的全局观。是以案件为原点拓展司法视野和维度,运用整个社会的信息网络来破解司法中的瓶颈,来开拓司法的疆界,来参与社会的治理。对大数据的认识就是对信息社会运行规律和管理模式的深层理解,但这种理解并没有教科书的路径,都是在摸着石头过河。而一旦能够过河,就可以占到了更高的思维维度来审视司法和社会,从而实现某种降维打击式的巨大突破。这种大杀器的司法能力怎么可能轻易获得呢?它一定是需要极大的耐心和定力。问一问自己,我们到底有多少耐心和定力呢?责任编辑 | 陈楠
审核人员 | 张文硕
本文声明 | 本文章仅限学习交流使用,如遇侵权,我们会及时删除。本文章不代表北大法律信息网(北大法宝)和北京北大英华科技有限公司的法律意见或对相关法规/案件/事件等的解读。
刘哲:重刑主义
刘哲:法律共同体的内与外
刘哲:一手认罪认罚,一手无罪辩护,公诉策略如何应对?
刘哲:我们对司法有何期待
刘哲:认罪认罚的结构与前途
杨铜铜:论立法目的司法适用的方法论路径
年轻律师,一定要去做冤案的推动工作
魏斌:智慧司法的法理反思与应对